首页> 外文OA文献 >Optimizing CNN-based object detection algorithms on embedded FPGA platforms
【2h】

Optimizing CNN-based object detection algorithms on embedded FPGA platforms

机译:在嵌入式FpGa平台上优化基于CNN的对象检测算法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Algorithms based on Convolutional Neural Network (CNN) have recently been applied to object detection applications, greatly improving their performance. However, many devices intended for these algorithms have limited computation resources and strict power consumption constraints, and are not suitable for algorithms designed for GPU workstations. This paper presents a novel method to optimise CNNbased object detection algorithms targeting embedded FPGA platforms. Given parameterised CNN hardware modules, an optimisation flow takes network architectures and resource constraints as input, and tunes hardware parameters with algorithm-specific information to explore the design space and achieve high performance. The evaluation shows that our design model accuracy is above 85% and, with optimised configuration, our design can achieve 49.6 times speed-up compared with software implementation.
机译:基于卷积神经网络(CNN)的算法最近已应用于对象检测应用程序,极大地提高了它们的性能。但是,许多用于这些算法的设备具有有限的计算资源和严格的功耗约束,因此不适合为GPU工作站设计的算法。本文提出了一种针对嵌入式FPGA平台优化基于CNN的对象检测算法的新方法。给定参数化的CNN硬件模块,优化流程将网络体系结构和资源限制作为输入,并使用算法特定的信息调整硬件参数,以探索设计空间并实现高性能。评估显示,我们的设计模型精度超过85%,并且通过优化配置,我们的设计与软件实现相比可以实现49.6倍的加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号